L'échec de la précision
Bien qu'un polynôme de haut degré puisse passer par chaque point de données, il produit souvent des oscillations du type « Runge ». Ces variations violentes n'ont aucune ressemblance avec le processus physique sous-jacent. Il est donc irrationnel d'exiger que la fonction d'approximation coïncide exactement avec les données, surtout lorsque les mesures sont sujettes à des variations.
Définir le meilleur ajustement : Les trois normes
Pour approximer, nous devons définir une fonction d'erreur $E$. La manière dont nous mesurons la « proximité » change entièrement le résultat :
Recherche de la minimisation de l'erreur maximale possible :
$$E_{\infty}(a_0, a_1) = \max_{1 \le i \le n} \{|y_i - (a_1 x_i + a_0)|\}$$
Piège : La méthode minimax attribue généralement trop d'importance à un ensemble de données qui est fortement erroné.
La somme des écarts absolus :
$$E_1(a_0, a_1) = \sum_{i=1}^{n} |y_i - (a_1 x_i + a_0)|$$
Piège : La fonction valeur absolue n'est pas différentiable en zéro, et nous pourrions ne pas être capables de trouver des solutions analytiques à ce système d'équations.
La norme standard en analyse numérique, en élevant au carré les résidus :
$$E_2(a_0, a_1) = \sum_{i=1}^{n} [y_i - (a_1 x_i + a_0)]^2$$
Cela crée une surface lisse et différentiable où le calcul différentiel peut facilement trouver un minimum global.
Contraintes analytiques
Choisir une métrique est un compromis entre logique et calcul différentiel. Par exemple, la méthode de déviation absolue ne donne pas assez d'importance à un point qui s'écarte considérablement de l'approximation, tandis que $L_2$ fournit un terrain solide qui pénalise fortement les points aberrants sans être entièrement dominé par un seul point erroné.